Lexikonexpansion - Vom XML-annotierten Stammformenlexikon zum Vollformenlexikon

نویسندگان

  • Jens Pönninghaus
  • Andreas Witt
چکیده

Lexika stellen für die Linguistik eine wichtige Informationsquelle dar. Im Gegensatz zu den meisten sprachtechnologischen Anwendungen, die auf spezialisierte computerlinguistische Lexika angewiesen sind, wird in der nachfolgend beschriebenen Implementierung ein klassisches, maschinenlesbares Wörterbuch als Lexikon verwendet.1 Der Vorteil der Nutzung klassischer Wörterbücher gegenüber der Verwendung spezialisierter computerlinguistischer Lexika für die Texttechnologie besteht insbesondere darin, dass sie eine Ressource bilden, die für eine Vielzahl von Sprachen zur Verfügung steht und dass einige dieser Lexika den Anspruch besitzen, das Lexeminventar einer Sprache zu einer bestimmten Zeit möglichst vollständig aufzuführen. Dadurch werden hochvolumige Wissensquellen erschlossen, deren Inhalte durch jahrelange Pflege gut validiert sind. Die Aufgabe der hier vorgestellten Komponente zur Lexikonexpansion ist die Überführung eines in XML-Notation vorliegenden Stammformenlexikons in ein Vollformenlexikon, das ebenfalls in XML notiert sein soll. Die Abbildung wird mit Hilfe einer Dokumentsemantik definiert. Es ergeben sich grundsätzlich zwei Möglichkeiten diese Transformation zu realisieren: Entweder dynamisch während der Zugriffszeit auf die Vollformen oder aber statisch in einem OfflineVerfahren. Die Entscheidung zugunsten der Offline-Variante erfolgt aus Gründen der zeiteffizienten maschinellen Verarbeitung relevanter Daten mit texttechnologischen Methoden. Für andere Anwendungsgebiete ist die Methode einer dynamischen Expansion, wie sie beispielsweise in den Beiträgen zur Morpholympics (vgl. Hausser, 1996) vorgestellt werden, zweifelsohne vorzuziehen.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Verknüpfung heterogener texttechnologischer Ressourcen

Gegenstand des Workshop-Beitrags ist die Verknüpfung heterogener linguistischer Ressourcen. Eine bedeutende Teilmenge von Ressourcen in der gegenwärtigen linguistischen Forschung und Anwendung besteht zum einen aus XML-annotierten Textdokumenten und zum anderen aus externen Ressourcen wie Grammatiken, Lexika oder Ontologien. Es wird eine Architektur vorgestellt, die eine Integration heterogener...

متن کامل

Vom Projekt zum Produkt durch Produktlinien und Variantenmanagement

Die Produktlinienentwicklung ist ein etabliertes Paradigma zur parallelen Entwicklung gleichartiger Softwaresysteme mit hoher Qualität und in kurzer Zeit. Dieser Beitrag gibt einen Überblick über die wesentlichen Konzepte und Bestandteile der Produktionsentwicklung und diskutiert, wie Konzepte der Produktlinienentwicklung einen erfolgreichen Übergang vom Projektzum Produktgeschäft unterstützen ...

متن کامل

Semantic Web Content Management

Im Rahmen der Semantic Web Initiative des W3C sind in jüngster Vergangenheit die RDF-basierten Standards RDFS und OWL verabschiedet worden, die als Wissensrepräsentationssprachen gemäß dem Ontologie-Paradigma im Web fungieren. Aufbauend auf diesen Technologien wird in dieser Arbeit gezeigt, wie im Zusammenspiel mit einem Ontologie-Editor die Grundlage für ein wissensbasiertes Web Content Manage...

متن کامل

Formulare mit Georeferenzen in der Landwirtschaft -ein Applikationsbeispiel

Die Verarbeitung von raumbezogenen Informationen hat in den letzten Jahren im Agrarsektor neue Perspektiven eröffnet und gewinnt stetig an Bedeutung. Insbesondere bei der Beauftragung agrarspezifischer Dienstleistungen, z.B. Bodenproben, Lohnaufträgen oder Beratungsdienstleistungen, werden raumbezogene Informationen benötigt. Allerdings ist die Bereitstellung der notwendigen Informationen oftma...

متن کامل

Vom klassischen Produkt- zum Lösungsgeschäft - Implikationen für eine Neugestaltung des Vergütungssystems im Vertrieb

Um dem steigenden Wettbewerbsdruck standhalten und den veränderten Kundenwünschen nachkommen zu können, wandeln sich viele Industrieunternehmen vom klassischen Produktzum umfassenden Lösungsanbieter, d.h. zum Erzeuger und Vermarkter so genannter hybrider Produkte. In diesem Beitrag stehen die Auswirkungen und Implikationen eines solchen Strategiewechsels für das Vergütungssystem von Vertriebsmi...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2001